期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. Spark框架优化的大规模谱聚类并行算法
崔艺馨, 陈晓东
计算机应用    2020, 40 (1): 168-172.   DOI: 10.11772/j.issn.1001-9081.2019061061
摘要578)      PDF (683KB)(267)    收藏
为解决谱聚类在大规模数据集上存在的计算耗时和无法聚类等性能瓶颈制约,提出了基于Spark技术的大规模数据集谱聚类的并行化算法。首先,通过单向循环迭代优化相似矩阵的构建,避免重复计算;然后,通过位置变换和标量乘法替换来优化Laplacian矩阵的构建与正规化,降低存储需求;最后,采用近似特征向量计算来进一步减少计算量。不同测试数据集上的实验结果表明:随着测试数据集的规模增加,所提算法的单向循环迭代和近似特征值计算的运行时间呈线性增长,增长缓慢,其近似特征向量计算与精确特征向量计算取得相近的聚类效果,并且算法在大规模数据集上表现出良好的可扩展性。在获得较好的谱聚类性能的基础上,改进算法提高了运行效率,有效缓解了谱聚类的计算耗时及无法聚类问题。
参考文献 | 相关文章 | 多维度评价
2. 基于深度卷积神经网络的肺结节检测算法
邓忠豪, 陈晓东
计算机应用    2019, 39 (7): 2109-2115.   DOI: 10.11772/j.issn.1001-9081.2019010056
摘要699)      PDF (1207KB)(404)    收藏

在传统的肺结节检测算法中,存在检测敏感度低,假阳性数量大的问题。针对这一问题,提出了基于深度卷积神经网络(CNN)的肺结节检测算法。首先,有目的性地简化传统的全卷积分割网络;然后,创新地加入对部分CNN层的深监督并使用改进的加权损失函数,获得高质量的候选肺结节,保证高敏感度;其次,设计了基于多尺度上下文信息的三维深度CNN来增强对图像的特征提取;最后,将训练得到的融合分类模型用于候选结节分类,以达到降低假阳率的目的。所提算法使用了LUNA16数据集,并通过对比实验验证算法的性能。在检测阶段,当每个CT检测出的候选结节数为50.2时,获得的敏感度为94.3%,与传统的全卷积分割网络相比提升了4.2个百分点;在分类阶段,竞争性能指标达到0.874。实验结果表明,所提算法能够有效提高检测敏感度和降低假阳率。

参考文献 | 相关文章 | 多维度评价